**The CASE of FEMU-Cheap, Accurate, Scalable and Extensible Flash Emulator**

平台介绍

经调研发现：现存SSD研究平台（模拟器/仿真器）类型有局限性，无法满足大规模SSD研究，且各类平台都或多或少有些许缺点（无法全面满足），再加上软件定义闪存及多层次贯穿研究的兴起，亟需一个支持全栈软硬件研究的平台。FEMU（基于软件（QEMU）仿真器（原型化））符合此要求，它开源/相对准确/支持升级（即IO线程数的增加对延迟影响不大）/支持扩展。

【Scalability】 可升级

问题：QEMU中NVMe驱动器在IO到来时/实现IO时向设备发送内存映射IO指令→引起VM-exit→性能下降

解决：FEMU改中断形式为轮询形式，使用专用线程持续轮询设备队列状态（即存储客户操作系统和QEMU之间映射表的共享内存）→无需内存映射IO指令→不会引起VM-exit

问题：QEMU使用异步IO执行备份映像文件的读写→开销大

解决：FEMU开辟新空间直接存储备份，DMA直接存取→不再使用备份映像文件→无需异步IO执行读写

【Accuracy】 准确性

IO到达时，FEMU发送DMA读写指令并用仿真完成时间标记各IO，同时将IO放入“end-io队列”（该队列以完成时间进行整理）。一旦当前时间大于某IO完成时间，即使用专用end-io线程从队列头取出IO并向主机发出end-io中断。

基本延迟模型：各plane仅有一个页寄存器，不能并行处理IO；读/写/擦除操作时间独立→读操作是先读取再传输；写操作是先传输再写入→则可由现在时间/传输时间/写时间/读时间/擦除时间按串行规律推进时间 **“规律一致”**

高级延迟模型：基于OCSSD的复杂性进行优化。

OCSSD的复杂性：1）各plane使用两个寄存器（数据寄存器/缓存寄存器），支持并行；2）延迟**规律不一致**：对于MLC，上/下页延迟不同；且映射方式无规律。

实验验证模型延时与OCSSD延时相似，误差小。（文章未说明高级延迟模型原理）